智能论文笔记

Automated Human Activity Recognition by Colliding Bodies Optimization-based Optimal Feature Selection with Recurrent Neural Network

Pankaj Khatiwada , Matrika Subedi , Ayan Chatterjee , Martin Wulf Gerdes

分类：机器学习

2020-10-07

在智能医疗保健中，人类活动识别（Har）被认为是传感器读数的普遍计算中的有效模型。家庭或社区中的环境辅助生活（AAL）有助于人民提供独立的护理和增强的生活质量。然而，许多AAL模型使用包括计算成本和系统复杂性的许多因素来限制。此外，由于其应用，HAR概念具有更多相关性。因此，本文旨在使用深度学习来实现来自智能传感器收集的数据，该数据在UC IRVINE机器学习存储库（UCI）中公开提供。所提出的模型涉及三个过程：（1）数据收集，（b）最佳特征选择，（c）识别。从基准存储库收集的数据最初遵循最佳特征选择，有助于选择最重要的功能。所提出的最佳特征选择是基于一种名为碰撞体优化（CBO）的新的元启发式算法。通过识别精度导出的目标函数用于完成最佳特征选择。这里，被称为经常性神经网络（RNN）的深度学习模型用于活动识别。相关基准数据集的提出模型优于现有的学习方法，与传统模型相比提供高性能。

translated by 谷歌翻译

Transformer-Based Named Entity Recognition for French Using Adversarial Adaptation to Similar Domain Corpora

Arjun Choudhry , Pankaj Gupta , Inder Khatri , Aaryan Gupta , Maxime Nicol , Marie-Jean Meurs , Dinesh Kumar Vishwakarma

分类：自然语言处理

2022-12-05

Named Entity Recognition (NER) involves the identification and classification of named entities in unstructured text into predefined classes. NER in languages with limited resources, like French, is still an open problem due to the lack of large, robust, labelled datasets. In this paper, we propose a transformer-based NER approach for French using adversarial adaptation to similar domain or general corpora for improved feature extraction and better generalization. We evaluate our approach on three labelled datasets and show that our adaptation framework outperforms the corresponding non-adaptive models for various combinations of transformer models, source datasets and target corpora.

translated by 谷歌翻译

Meta Learning for Few-Shot Medical Text Classification

Pankaj Sharma , Imran Qureshi , Minh Tran

分类：自然语言处理

2022-12-03

Medical professionals frequently work in a data constrained setting to provide insights across a unique demographic. A few medical observations, for instance, informs the diagnosis and treatment of a patient. This suggests a unique setting for meta-learning, a method to learn models quickly on new tasks, to provide insights unattainable by other methods. We investigate the use of meta-learning and robustness techniques on a broad corpus of benchmark text and medical data. To do this, we developed new data pipelines, combined language models with meta-learning approaches, and extended existing meta-learning algorithms to minimize worst case loss. We find that meta-learning on text is a suitable framework for text-based data, providing better data efficiency and comparable performance to few-shot language models and can be successfully applied to medical note data. Furthermore, meta-learning models coupled with DRO can improve worst case loss across disease codes.

translated by 谷歌翻译

RadFormer: Transformers with Global-Local Attention for Interpretable and Accurate Gallbladder Cancer Detection

Soumen Basu , Mayank Gupta , Pratyaksha Rana , Pankaj Gupta , Chetan Arora

分类：计算机视觉

2022-11-09

We propose a novel deep neural network architecture to learn interpretable representation for medical image analysis. Our architecture generates a global attention for region of interest, and then learns bag of words style deep feature embeddings with local attention. The global, and local feature maps are combined using a contemporary transformer architecture for highly accurate Gallbladder Cancer (GBC) detection from Ultrasound (USG) images. Our experiments indicate that the detection accuracy of our model beats even human radiologists, and advocates its use as the second reader for GBC diagnosis. Bag of words embeddings allow our model to be probed for generating interpretable explanations for GBC detection consistent with the ones reported in medical literature. We show that the proposed model not only helps understand decisions of neural network models but also aids in discovery of new visual features relevant to the diagnosis of GBC. Source-code and model will be available at https://github.com/sbasu276/RadFormer

translated by 谷歌翻译

Alexa, Let's Work Together: Introducing the First Alexa Prize TaskBot Challenge on Conversational Task Assistance

Anna Gottardi , Osman Ipek , Giuseppe Castellucci , Shui Hu , Lavina Vaz , Yao Lu , Anju Khatri , Anjali Chadha , Desheng Zhang , Sattvik Sahai

分类：自然语言处理 | 人工智能

2022-09-13

自2016年成立以来，Alexa奖计划使数百名大学生能够通过Socialbot Grand Challenge探索和竞争以发展对话代理商。挑战的目的是建立能够与人类在流行主题上连贯而诱人的代理人20分钟，同时达到至少4.0/5.0的平均评分。但是，由于对话代理商试图帮助用户完成日益复杂的任务，因此需要新的对话AI技术和评估平台。成立于2021年的Alexa奖Taskbot Challenge建立在Socialbot Challenge的成功基础上，通过引入交互式协助人类进行现实世界烹饪和做自己动手做的任务的要求，同时同时使用语音和视觉方式。这项挑战要求TaskBots识别和理解用户的需求，识别和集成任务和域知识，并开发新的方式，不分散用户的注意力，而不必分散他们的任务，以及其他挑战。本文概述了Taskbot挑战赛，描述了使用Cobot Toolkit提供给团队提供的基础架构支持，并总结了参与团队以克服研究挑战所采取的方法。最后，它分析了比赛第一年的竞争任务机器人的性能。

translated by 谷歌翻译

Action-based Early Autism Diagnosis Using Contrastive Feature Learning

Asha Rani , Pankaj Yadav , Yashaswi Verma

分类：计算机视觉 | 机器学习

2022-09-12

自闭症，也称为自闭症谱系障碍（或ASD），是一种神经系统疾病。它的主要症状包括（口头和/或非语言）交流的难度以及僵化/重复的行为。这些症状通常与正常（对照）个体没有区别，因此这种疾病在幼儿期间仍未诊断，导致治疗延迟。由于学习曲线在最初年龄段是陡峭的，因此对自闭症的早期诊断可以在适当的时间进行足够的干预措施，这可能会对自闭症儿童的成长产生积极影响。此外，传统的自闭症诊断方法需要多次访问专门的精神科医生，但是这一过程可能很耗时。在本文中，我们提出了一种基于学习的方法，可以使用简单和小型动作视频剪辑的主题自闭症诊断。此任务尤其具有挑战性，因为可用的带注释数据的量很小，并且两类（ASD和控制）的样本之间的变化通常是无法区分的。从基线编码器顶部的跨凝结损失学到的二进制分类器的性能不佳也可以明显看出这一点。为了解决这个问题，我们在自我监督和监督的学习框架中采用对比功能学习，并表明这些学习可能会导致二元分类器对此任务的预测准确性显着提高。我们通过对两个公开可用数据集的不同设置进行彻底的实验分析来进一步验证这一点。

translated by 谷歌翻译

Unsupervised Contrastive Learning of Image Representations from Ultrasound Videos with Hard Negative Mining

Soumen Basu , Somanshu Singla , Mayank Gupta , Pratyaksha Rana , Pankaj Gupta , Chetan Arora

分类：计算机视觉

2022-07-26

丰富的时间信息和视角中的变化使视频数据成为使用无监督的对比度学习（UCL）技术学习图像表示的有吸引力的选择。最先进的（SOTA）对比度学习技术将视频中的帧视为嵌入空间中的阳性，而其他视频的框架则被视为负面因素。我们观察到，与自然场景视频中对象的多种视图不同，超声（US）视频捕获了器官的不同2D片。因此，即使是相同的美国视频的暂时遥远框架之间几乎没有相似之处。在本文中，我们建议相反使用诸如硬底面的框架。我们主张在UCL框架中对硬度敏感的负挖掘课程进行挖掘，并在硬度敏感的负面挖掘课程中挖掘，以学习丰富的图像表示。我们部署框架以从美国视频中学习胆囊（GB）恶性肿瘤的表示。我们还构建了第一个大型US视频数据集，其中包含64个视频和15,800帧，用于学习GB表示。我们表明，经过我们框架训练的标准RESNET50骨干线可以提高使用SOTA UCL技术预测的模型的准确性，并在Imagenet上对ImageNet上的有监督的预处理模型提高了GB恶性检测任务的预期模型，提高了2-6％。我们进一步验证了方法在COVID-19病理的公开肺图像数据集上的普遍性，与SOTA相比，改善了1.5％。源代码，数据集和模型可在https://gbc-iitd.github.io/usucl上找到。

translated by 谷歌翻译

Exploration of Parameter Spaces Assisted by Machine Learning

A. Hammad , Myeonghun Park , Raymundo Ramos , Pankaj Saha

分类：机器学习

2022-07-20

我们展示了各种功能和类，可以通过改进机器学习协助的参数空间进行采样过程。特别注意设置理智默认值的目标是，不同问题要求的调整仍然很小。从查找参数空间的界限到在感兴趣的领域中积累样本的界限，可以使用此例程集来进行不同类型的分析。特别是，我们讨论了通过合并不同的机器学习模型来帮助的两种方法：回归和分类。我们表明，机器学习分类器可以为探索参数空间提供更高的效率。此外，我们引入了一种提升技术，以改善过程开始时的缓慢收敛性。在一些示例的帮助下，更好地解释了这些例程的使用，这些示例说明了人们可以获得的结果类型。我们还包括用于获取示例的代码的示例，以及可以对调整计算适应其他问题的调整的描述。我们通过在探索与测得的HigGS玻色子信号强度匹配的两个HIGGS DoubleT模型的参数空间时显示这些技术的影响来最终确定。本文使用的代码和有关如何使用它的说明可在网络上可用。

translated by 谷歌翻译

ILASR: Privacy-Preserving Incremental Learning for AutomaticSpeech Recognition at Production Scale

Gopinath Chennupati , Milind Rao , Gurpreet Chadha , Aaron Eakin , Anirudh Raju , Gautam Tiwari , Anit Kumar Sahu , Ariya Rastrow , Jasha Droppo , Andy Oberlin

分类：自然语言处理 | 人工智能

2022-07-19

增量学习是一种范式，可以通过流数据大规模构建模型构建和更新。对于端到端的自动语音识别（ASR）任务，缺乏人类注释的标签，以及需要保留模型建设政策的隐私政策，这使其成为艰巨的挑战。受这些挑战的激励，在本文中，我们使用基于云的框架为生产系统展示了从隐私保存自动语音识别（ILASR）的增量学习中的见解。我们的意思是，通过保留隐私性，对没有人类注释的短暂数据使用。该系统是用于增量/持续学习的生产LevelAsASR模型的一步，该模型提供了接近实时测试床，以在云中进行端到端ASR实验，同时遵守保留隐私的政策。我们表明，即使在没有人类注释的标签的情况下，拟议的系统也可以在六个月的新时间内显着改善生产模型（3％），而在增量学习中，较弱的监督和大批量大小。在新时期，这种改进比测试集的新单词和短语相比为20％。我们在ASR的同时进一步探讨了拥有有效的教师模型和使用大批量大小的实用性的同时，以保护隐私的增量方式展示了模型构建的有效性。

translated by 谷歌翻译

Part-of-Speech Tagging of Odia Language Using statistical and Deep Learning-Based Approaches

Tusarkanta Dalai , Tapas Kumar Mishra , Pankaj K Sa

分类：自然语言处理

2022-07-07

自动言论（POS）标记是许多自然语言处理（NLP）任务的预处理步骤，例如名称实体识别（NER），语音处理，信息提取，单词sense sisse disampigation和Machine Translation。它已经在英语和欧洲语言方面取得了令人鼓舞的结果，但是使用印度语言，尤其是在Odia语言中，由于缺乏支持工具，资源和语言形态丰富性，因此尚未得到很好的探索。不幸的是，我们无法为ODIA找到一个开源POS标记，并且仅尝试为ODIA语言开发POS标记器的尝试。这项研究工作的主要贡献是介绍有条件的随机场（CRF）和基于深度学习的方法（CNN和双向长期短期记忆）来开发ODIA的语音部分。我们使用了一个公开访问的语料库，并用印度标准局（BIS）标签设定了数据集。但是，全球的大多数语言都使用了带有通用依赖项（UD）标签集注释的数据集。因此，要保持统一性，odia数据集应使用相同的标签集。因此，我们已经构建了一个从BIS标签集到UD标签集的简单映射。我们对CRF模型进行了各种特征集输入，观察到构造特征集的影响。基于深度学习的模型包括BI-LSTM网络，CNN网络，CRF层，角色序列信息和预训练的单词向量。通过使用卷积神经网络（CNN）和BI-LSTM网络提取角色序列信息。实施了神经序列标记模型的六种不同组合，并研究了其性能指标。已经观察到具有字符序列特征和预训练的单词矢量的BI-LSTM模型取得了显着的最新结果。

translated by 谷歌翻译